iT邦幫忙

2023 iThome 鐵人賽

DAY 17
0
AI & Data

深入探索AI模型系列 第 17

【Day 17】 Random Forest(隨機森林)

  • 分享至 

  • xImage
  •  

前幾天講完了Decision Tree和CART Tree,今天要來講Random Forest(隨機森林),Random Forest的forest就是很多個CART Tree所組成的forest。Radom forest的基本運作概念就是結合了很多的CART Tree並加入隨機的訓練資料來加強最後的運算結果。

那forest中的Tree,我們已經在介紹CART Tree的時候講過了(還沒看過的讀者可以先看看【Day 15】的內容),今天要來講Random Forest的Random是什麼意思。

Random Forest的Random使用的是Bootstrap Aggregation,他的概念就是從原本的資料集中多次隨機取樣一定數量的資料。如此一來,我們就可以獲得多個從原始資料集衍生出來的多個資料集了。

從下方的例子來看,我們的原始資料有5顆紅球、5顆藍球、5顆黃球,經過3次Bootstrap取樣5個樣本。第一次取到了2顆紅球、2顆藍球、1顆黃球,取完第一次過後,要把這5顆球放回原始資料之中,再接著取第2次的資料。第二次取樣獲得了1顆紅球、1顆藍球、3顆黃球,之後一樣放回原始資料。最後取第三次,取到了2顆紅球、1顆藍球、2顆黃球。之後若是還要繼續取樣,則是用一樣的規則,每次取完就放回原始資料再繼續下一次的取樣。

https://ithelp.ithome.com.tw/upload/images/20230820/20150784AFsPtMofox.png

在了解完Bootstrap Aggregation(Random)以及CART Tree(Forest)的概念後,我們只要將他們給結合就可以變成Random Forest。先用Bootstrap獲取了多個資料集再用CART Tree去做出決策以得出最好的結果,不斷重複這個步驟,最後得到的結果就是Random Forest的結果。


上一篇
【Day 16】 Decision Tree實作
下一篇
【Day 18】 Random Forest實作
系列文
深入探索AI模型30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言